The 20 newsgroups text dataset
scikit-learnに組み込まれたdatasetの1つ
https://scikit-learn.org/stable/datasets/real_world.html#newsgroups-dataset
7.2.2.2 TFIDFでsparseなベクトルにする
7.2.2.3 積ん読(TODO)
https://scikit-learn.org/stable/modules/generated/sklearn.datasets.fetch_20newsgroups.html
構造化されている!
remove引数
May contain any subset of (‘headers’, ‘footers’, ‘quotes’).